小米-数据仓库高级工程师面试题
导读:本文将带你一起回顾小米大数据数仓面试题。十一节假日前面试应邀整理总结,借“数据仓库与Python大数据”公众号分享给大家,一起进步。
小米大数据数仓岗位面试题
1:先讲数仓项目流程,然后sql优化,数据倾斜,Hive调优,压缩格式,Hadoop原理, MR Shuffle过程,写过那些UDF
2:现场手写sql(行转列,留存率,7天连续3天登录,还有就是现场临时给的sql题)
3:数仓怎么分层的,主题怎么划分,项目中各层模型如何设计的,然后模型做了那些优化,拉链表怎么做
4:sqoop和datax的区别,数据导入导出遇到那些问题case
5:Spark sql和Hive sql的执行过程原理,Spark的提交过程参数设置, Saprk RDD算子有哪些,Spark做离线做了那些方面的优化,Spark shuffle过程
6:Spark和Flink对比,Flink运行原理,架构,消息怎么精准一次性,消息挤压 ,Flink CDC等等
ps:关于Flink的问题我直接说项目中没用过,自己学过,一般面试官就简单问一下就过了
7 Hbase 原理 和Kakfa原理, Kafka结合Flink一起问
8 OLAP引擎Clickhouse,Doris,Impala,ES等相关原理和使用优化
9 Mysql的索引场景题,连着问了好几个什么场景用什么索引(当时问的我焦头烂额)
10 Shell 中的一些基本命令,$1和$0的区别,怎么查找后台运行的命令 ,写过那些脚本case
作者寄语
今天的分享就到这里,希望能抛砖引玉,对你有所帮忙。关注公众号第一批粉丝,学到了很多干货和技能,也希望今天的分享能让大家有所收获。最后,再次谢邀,感谢紫霞约稿,也欢迎大家关注这个大数据领域高质量公众号,一起进步!
作者:群友(应群友要求匿名) 征稿:欢迎广大读者粉丝朋友投稿,及相关事宜请加v:iom1128,谢谢!
▼ 阿里 | 记一次蚂蚁金服面试经历
▼ 头条 | 大厂大数据开发面试经验
▼ 快手 | 记一次数据岗位大厂面试
▼ 校招 | 一个BAT校招面试官 1 天
更多干货,请戳"阅读原文"到"面试系列"查看
!关注不迷路~ 各种干货、资源定期分享!